دسته بندی داده های دورده ای با ابرمستطیل موازی محورهای مختصات
نویسندگان
چکیده
یکی از زمینه های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می باشد. در یادگیری با ناظر برچسب داده های آموزشی موجود است. در مسایل دورده ای، هدف محاسبه فرضیه ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده های با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روش های یادگیری با ناظر پیشنهاد شده است. به عنوان مثال می توان به درخت های تصمیم، یادگیر svm و روش های نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درخت های تصمیم متمرکز می شویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحه های تقسیم کننده در فضای d بعدی است، بطوریکه داده های موجود را به درستی رده بندی کند و تا حد ممکن رده بندی صحیح داده های آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیک پذیری در هندسه محاسباتی نزدیک می کند. از بین کلیه الگوریتم های تفکیک پذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می کنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی می کنیم. نتیجه پیاده سازی نشان دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده c4.5 است.
منابع مشابه
دستهبندی دادههای دوردهای با ابرمستطیل موازی محورهای مختصات
One of the machine learning tasks is supervised learning. In supervised learning we infer a function from labeled training data. The goal of supervised learning algorithms is learning a good hypothesis that minimizes the sum of the errors. A wide range of supervised algorithms is available such as decision tress, SVM, and KNN methods. In this paper we focus on decision tree algorithms. When we ...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملرویکرد شبیهسازی در حل مسأله زمانبندی ماشین های موازی پردازشگر دسته ای با زمان های احتمالی
در این مقاله، مسأله زمانبندی ماشینهای موازی پردازشگر دستهای با هدف حداقل کردن حداکثر زمان تکمیل کارها بررسی میشود. نوآوری این پژوهش، به کارگیری زمان های پردازش و در دسترس بودن کارها به صورت احتمالی است. در تحقیقات پیشین اثبات شده است که مسأله مورد بررسی دارای پیچیدگی سخت است. بنابراین، از روشهای ابتکاری برای حل مسأله استفاده میشود. مسأله مورد مطالعه، دو مرحله تصمیمگیری دارد. در مرحله ا...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده ها...
متن کاملروشی کارا برای پیادهسازی موازی الگوریتم دسته بندی بسته درخت سلسلهمراتبی بر روی واحد پردازش گرافیکی
چکیده: دستهبندی بستهها، پردازشی اساسی در پردازندههای شبکهای است. در این فرآیند، بستههای ورودی از طریق تطبیق با مجموعهای از فیلترها به جریانهای مشخص طبقهبندی میشوند. پیادهسازیهای نرمافزاری الگوریتمهای دستهبندی با وجود هزینه کمتر و توسعهپذیری بیشتر نسبت به پیادهسازیهای سختافزاری، سرعت پایینتری دارند. در این مقاله، از قابلیت پردازش موازی پردازندههای گرافیکی برای تسریع الگوری...
متن کاملدسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها
در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
فناوری اطلاعات و ارتباطات ایرانجلد ۷، شماره ۲۵، صفحات ۱-۱۴
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023